iT邦幫忙

第 12 屆 iThome 鐵人賽

DAY 10
0
AI & Data

AWS 數據處理與分析實戰系列 第 10

Day 10 Glue Data Catalog 教學 - Part 7

  • 分享至 

  • xImage
  •  

講完整的流程後,我們再回來說明 Table 的資訊與可調整的部分

  1. Table 說明
    6-1. 點選創建成功的 Table Name

https://ithelp.ithome.com.tw/upload/images/20200924/20129236K6G5rHTYU2.png

6-2. 可以看到這個 Table 的詳細資訊, Classification 是哪一個類型的資料,原始資料所在的 S3 路徑,Serde serialization lib 爬取資料時所使用的 Lib,Serde parameters 代表主要的分隔符號

https://ithelp.ithome.com.tw/upload/images/20200924/20129236PK2DQDcjNI.png

6-3. 將畫面往下拉可以看到 Schema 的部分,這些欄位名稱是由 CSV 檔的 Headings 產生而來,Data type 則會由 Crawler 自動判別

https://ithelp.ithome.com.tw/upload/images/20200924/20129236yphyP77ZVe.png

6-4. 假設你對 Data Type 的判別不滿意,或是臨時想修改欄位名稱,可以點選右上角的 Edit schema 進行修改

https://ithelp.ithome.com.tw/upload/images/20200924/20129236gB31S0bcm4.png

6-5. 直接點選要修改的 Data Type 就可以,常見的 Date Type 都有,可以根據需求進行選擇,名稱的部分如果臨時需要修改也可以在這個頁面直接處理,一樣點選要修改的欄位名稱進行修改,但如果再重新執行一次 Crawler 這些修改就會被還原,所以建議欄位名稱的修改在 Classifier 進行,可以參考 Day 5 的Classifier CSV 設定,Data Type 的部分建議透過 SQL 進行轉換或 ETL 時再進行轉換 Data Type

https://ithelp.ithome.com.tw/upload/images/20200924/20129236zLo3Qp0EEs.png


上一篇
Day 9 Glue Data Catalog 教學 - Part 6
下一篇
Day 11 Glue Partition 教學 - Part 1
系列文
AWS 數據處理與分析實戰30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言